草庐IT

python - 在 Python 中清理 HTML

全部标签

python - ElementTree XPath 奇怪的行为

你好我在Python2.7中使用ElementTree(1.3)并享受XPath功能,然而,其中一个搜索结果让我感到惊讶。我的XML示例:问题一:当我使用findall获取第一个找到的元素时version="2.2.0.0"found=list(txml.findall(".//BackEnd[@version='%s']"%version))returnfoundandfound[0]orNone它什么也没找到。然而,当我更改XML文件时,BackEnd元素包含子元素,然后正确找到搜索到的元素。你遇到过这样的行为吗?我是不是做错了什么或者这是ElementTree实现中的错误?问题二

php - 添加新的 XML 标记代码(PHP、HTML)

我在扩展一些代码时遇到问题。我基本上需要向现有的添加一个新的xml字段。完整代码如下:HTML文件functionshowRSS(str){if(str.length==0){document.getElementById("rssOutput").innerHTML="";return;}if(window.XMLHttpRequest){//codeforIE7+,Firefox,Chrome,Opera,Safarixmlhttp=newXMLHttpRequest();}else{//codeforIE6,IE5xmlhttp=newActiveXObject("Microso

html - xslt 允许在 concat 和 normalize-space 中使用参数

我正在查看一些代码,我看到了这个:我只是想知道这个信息,我可以肯定地说$list是一个string并且normalize-space($list)肯定会返回给我一个string和行concat(normalize-space($list),'')肯定会返回一个string(最后一个该字符串的字符是空格?) 最佳答案 $list可以是字符串、数字、节点集,任何东西。结果将是一个字符串。是的,最后一个字符将是一个空格。例如:stringotherstring返回18stringotherstring

python - 如何使用任何 xml 库替换节点的全部内容?

我正在尝试使用Python解析xml文件,但我有一些标签可能包含xml数据。例如:我想这样写CDATA标签:]]>我试过(使用lxml):a=etree.fromstring(data)foreina.findall("code"):e.text=etree.CDATA(etree.tostring(e))但是我得到:]]> 最佳答案 您的替换代码找到了元素并将其序列化为元素的新文本​​。您似乎只想包含的子元素,虽然。尝试设置e.text至CDATA(e.text)而不是序列化e的结果.

java - 获取一个 XML 文件和一个 XSL 文件并从中生成一个 HTML 字符串?

我有2个字符串,一个是我使用JavaDOM接口(interface)构造的XML字符串,一个是我想绑定(bind)到该XML文件的外部XSL文件。我尝试使用Java转换方法,但没有成功(这意味着我似乎无法在网络上找到任何解决方案)。我如何获取XML文件和XSL文件并从中生成HTML字符串?我正在尝试做的是将XML页面注入(inject)到我的JSP页面中。澄清一下:这是在servlet中完成的,而不是在JavaScript中完成的。更多信息:我在运行时将XML创建为一个字符串,我得到的XSL文件存储在服务器上,我想做的是在用户单击某个按钮时将XSL文件更改的XML显示给用户网站上的链接

html - 什么是 xml 建议的 url

使用此网址Googlesuggestions您可以获得单词cars的xml建议列表将结果限制为Googlemap结果的URL是什么? 最佳答案 我认为GoogleGeocodeapi可能是你要找的。该页面上有文档,用于使用如下查询搜索位置的xml输出:http://maps.googleapis.com/maps/api/geocode/xml?address=&sensor=true看起来很强大。通过searchingforthetown我住我在xml中得到多个结果,每个结果包含区域、坐标、区域、国家、邮政编码等。

c# - Doxygen:HTML 太大

我有一个非常大的类,它有很好的记录。Doxygen用于生成HTML文档,但对于此类,HTML文件很大~12MB,这对我来说太大了。发生这种情况是因为Doxygen在一个文件中列出了该类的所有文档,但在这种情况下,最好将类函数文档拆分在单独的页面中,以便有一个合理的页面。我想问的是:有什么解决办法吗?也许对此有特殊的选择/技巧?要么...也许我可以禁用此类的“正常”文档,然后将类函数文档复制到组织得更好的页面中?在这种情况下,我应该@copydoc那些函数,不是吗?你有什么建议? 最佳答案 这是可能的!有一个配置键:'SEPARATE

html - 格式化 XSLT 文档以在一行中显示多个昵称

我的xml文档包含一个人的列表,这些人可以有0个或多个昵称。我在尝试在我的xslt文档中正确显示所有昵称时遇到问题。我可以使用以下命令列出所有昵称:Nickname:它的输出是这样的:Nickname:nickname1Nickname:nickname2这是一个问题,因为我想得到一个没有昵称的输出:被列出了很多次,即Nickname:nickname1,nickname2.我目前拥有的是:Nickname:,问题是:昵称将始终至少打印一次,即使昵称不存在也是如此。总是会留下一个逗号(,)。我希望有解决这两个问题的建议,我尝试使用!=""但我不确定如果一个人不包含昵称是否允许这样做。谢

python - 如何输出 XML 实体引用

我正在使用Pythonxml.etree.ElementTree输出XML。我想用实体引用输出它,这些实体引用将在解析XML时被替换。通常'&'被转义为&因为'&'用于声明实体引用。但是,我真的想写一个实体引用。例如,我想编写一个包含实体引用&manifestName;的XML文件:>>>fromxml.etree.ElementTreeimportElement,tostring>>>manifest=Element('manifest')>>>manifest.text='&manifestName;'>>>tostring(manifest)返回一个转义的符号:'&man

html - XML 数据到 HTML - 看起来很容易,但我很难

使用经典的ASP和MSXML2.DOMDocument,我试图将此XML转换为HTML表格。谁能指出我正确的方向?什么是逻辑过程?这是我要转换的XML。所需的输出格式在这里-http://ashleylangford.com/tableex.gif3866602909088755239410722742294281216286798352311233354814810173358483256111231366441504016954506355995892683435374701626033259241358153124218964699803879318781592376255416